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RESUMO 


GRISI-FILHO, J. H. H. Caracterizagao de circuitos pecuarios com base em redes 
de movimentagao de animais. [Characterization of production zones based on animal 
movement networks.] 2012. 46 f. Tese (Doutorado em Ciencias) - Faculdade de Medicina 
Veterinaria e Zootecnia, Universidade de Sao Paulo, Sao Paulo, 2012. 

Uma rede e um conjunto de nos conectados entre si por um conjunto de arestas. Redes 
podem representar qualquer conjunto de objetos que possuam relagoes entre si. Comu- 
nidades sao conjuntos de nos relaeionados de uma maneira significativa, provavelmcnte 
compartilhando propriedades e/ou atuando de forma similar dentro de uma rede. Quando 
a analise de redes e aplicada ao estudo de padroes de movimentagao animal, as unidades 
epidemiologicas de interesse (propriedades, estabelecimentos, municfpios, estados, pafses, 
etc) sao representadas corno nos, enquanto a movimentagao animal entre elas e repre- 
sentada por arestas de uma rede. Descobrir a estrutura de uma rede, e portanto as 
preferences e rotas comerciais, pode ser util para um pesquisador ou gestor de saude 
animal. Foi implcmentado um algoritmo de detecgao de comunidades para encontrar gru- 
pos de propriedades que e consistente com a definigao de circuito pecuario, assumindo 
que uma comunidade e um grupo de nos (fazendas, abatedouros) no qual um animal vai 
nrais provavelmcnte permanecer durante sua vida. Este algoritmo foi aplicado na rede in¬ 
terna de movimentagao animal de 2007 do Estado do Mato Grosso. Esse banco de dados 
contem informagao sobre 87.899 propriedades e 521.431 movimentagoes durante o ano, 
totalizando 15.844.779 de animais movinrentados. O algoritmo de detecgao de comunida¬ 
des encontrou uma partigao da rede que mostra um claro padrao geografico e comercial, 
duas importantes caracterfsticas para aplicagoes em medicina veterinaria preventiva, alem 
de possuir uma interpretagao clara e significativa em redes de comercio onde ligagoes se 
estabelecem a partir da escolha dos nos envolvidos. 

Palavras-chave: Epidemiologia. Analise de redes. Analise de comunidades. Circuito 
pecuario. Movimentagao animal. 


ABSTRACT 


GRISI-FILHO, J. H. H. Characterization of production zones based on animal 
movement networks. [Caracterizagao de circuitos pecuarios com base em redes de 
movimentagao de animais.] 2012. 46 f. Tese (Doutorado em Ciencias) - Faculdade de 
Medicina Veterinaria e Zootecnia, Universidade de Sao Paulo, Sao Paulo, 2012. 

A network is a set of nodes that are linked together by a set of edges. Networks can 
represent any set of objects that have relations among themselves. Communities are 
sets of nodes that are related in an important way, probably sharing common properties 
and/or playing similar roles within a network. When network analysis is applied to study 
the livestock movement patterns, the epidemiological units of interest (farm premises, 
counties, states, countries, etc.) are represented as nodes, and animal movements between 
the nodes are represented as the edges of a network. Unraveling a network structure, 
and hence the trade preferences and pathways, could be very useful to a researcher or 
a decision-maker. We implemented a community detection algorithm to find livestock 
communities that is consistent with the definition of a livestock production zone, assuming 
that a community is a group of farm premises in which an animal is more likely to 
stay during its life time than expected by chance. We applied this algorithm to the 
network of within animal movements made inside the State of Mato Grosso, for the year 
of 2007. This database holds information about 87,899 premises and 521,431 movements 
throughout the year, totalizing 15,844,779 animals moved. The community detection 
algorithm achieved a network partition that shows a clear geographical and commercial 
pattern, two crucial features to preventive veterinary medicine applications, and also has 
a meaningful interpretation in trade networks where links emerge from the choice of trader 
nodes. 

Keywords: Epidemiology. Network analysis. Community analysis. Livestock production 


zone. Animal movement. 
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1 INTRODUQAO 


1.1 Redes 

Uma rede e um conjunto de nos (ou vertices) conectados entre si por urn con- 
junto de arestas (ou ligagoes), como demonstrado na figura 1.1. Redes podem representar 
qualquer conjunto de objetos que possuam relagoes entre si. Podem, por exemplo, re¬ 
presentar as relagdes sociais entre individuos (figura 1.2). Em uma rede ponderada cada 
aresta possui um valor, que representa a intensidade da ligagao entre dois nos. Redes 
podem ser direcionadas e nao-direcionadas: uma rede direcionada apresenta a diregao da 
relagao entre dois nos, sendo portanto uma ligagao de saida para um e uma ligagao de 
entrada para o outro; uma rede nao-direcionada assume que a relagao entre dois nos e 
sernpre reciproca. Em uma rede direcionada e ponderada, o grau de entrada de um no 
( k ™) e o numero de nos conectados a este por ligagdes de entrada, enquanto o grau de 
saida (k° ut ) e o numero de nos conectados a este por ligagdes de saida. Analogamente, o 
grau ponderado de entrada ( kw j n ) e a soma dos valores das arestas que um no recebe, e 
o grau ponderado de saida ( kw° ut ) e a soma dos valores das arestas que um no envia. O 
grau ponderado total (kwi) e igual a soma dos graus ponderados de entrada e de saida, 
enquanto o grau total ( ki ) e o numero de nos ligados ao no de interesse, independente da 
diregao da ligagao. 

Figura 1.1 - Ilustragao de uma rede, com indicagao de nos e arestas 



Quando a analise de redes e aplicada ao estudo da movimentagao animal dentro 
de um sistema produtivo, as unidades epidemiologicas de interesse (propriedades, esta- 
belecimentos, municipios, estados, paises, etc) sao representadas como nos, enquanto a 
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Figura 1.2 - Rede de associagoes frequentes entre 62 golfinhos de Doubtful Sound, New 
Zealand (Lusseau et al., 2003) 



movimentaqao animal entre elas e representada por arestas de uma rede, onde o valor de 
cada aresta traz o numero de animais comercializados entre dois nos. Assim, o grau de 
entrada de um no equivale a quantidade de unidades que enviaram animais para este e 
o grau de saida equivale a quantidade de estabelecimentos para os quais um no enviou 
animais. O grau ponderado de entrada equivale a quantidade de animais comprados e o 
grau ponderado de saida equivale a quantidade de animais vendidos por uma propriedade. 
A analise de redes tern sido utilizada para estudar uma grande variedade de problemas 
dentro da medicina veterinaria, incluindo analises de epidemias (Gibbens et al., 2001), 
analises etologicas (Lusseau e Newman, 2004), padroes de distribuicao de doengas, mo- 
delos preditivos (Harvey et al., 2007), analises de risco, eficacia de sistemas de vigilancia 
entre outros. Martinez-Lopez, Perez e Sanchez-Vizcaino (2009) fazem uma revisao sobre 
o assunto. 

1.2 Analise de Comunidades em Medicina Veterinaria 

Comunidades sao conjuntos de nos relacionados entre si de uma maneira signifi- 
cativa, provavelmente compartilhando propriedades e/ou atuando de forma similar dentro 
de uma rede. Estudos recentes utilizaram a analise de comunidades em redes de transito 
animal com o intuito de revelar a estrutura subjacente da rede (Green, Gregory e Munro, 
2009; Green et al., 2011; Lentz et al., 2011). 
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Descobrir essa estrutura e portanto as preferencias de comercio entre proprieda- 
des pode se mostrar util para um pesquisador ou tomador de decisao. Em primeiro lugar, 
permite a identificagao dos fluxos de comercio entre zonas de produgao, possibilitando 
um mclhor entendimento do sistema de produgao animal. A existencia e funcionalidade 
de grupos dentro de uma rede pode influenciar o espalhamento de doengas, alterando a 
velocidade de espalhamento, o tamanho final e a duragao de uma epidemia (Salathe e 
Jones, 2010). Analises de comunidade poderiam ser usadas para determinar os grupos de 
uma amostra estratificada que visa levar em consideragao o transito animal, ou ajudar 
no planejamento de um sistema de vigilancia voltado ao risco, escolhendo grupos de nos 
sob risco que possuam intenso comercio entre si. Seria possfvel, na ocasiao de erradicagao 
de uma doenga especifica, dividir um programa sanitario em etapas nas quais um grupo 
de munici'pios e sanitizado por vez, caso esses municipios apresentem baixo risco de rein- 
fecgao devido a movimentos oriundos de fora do grupo. Propriedades que compartilham 
preferencias comerciais podem compartilhar praticas de manejo e biosseguranga, e serein 
selecionadas para um programa sanitario direcionado. A Organizagao Mundial de Saude 
Animal (OIE), define em seu Terrestrial Animal Health Code (World Organisation for Ani¬ 
mal Health, 2010), os conceitos de zoneamento, regionalizagao e compartimento. Dada 
a dificuldade de estabelecer e rnanter uma condigao livre de doenga para o territorio de 
um pafs inteiro, pode ser vantajoso estabelecer e rnanter uma subpopulagao com condigao 
sanitaria diferenciada dentro de seu territorio. Assim, a delimitagao de zonas sanitarias 
dentro de uma regiao pode levar em consideragao nao apenas municipios com as mesmas 
condigoes sanitarias, mas tambem regibes que possuam intenso comercio com estes. A 
analise de comunidades pode ajudar no planejamento da fronteira deste tipo de area, caso 
haja isolamento de uma subpopulagao (p.ex, com restrigao de movimentagao), bloque- 
ando o comercio entre fazendas de areas diferentes: essa abordagem poderia otimizar a 
divisao de tal regiao e avaliar quanta perda economica e esperada devido a restrigao de 
comercio apos uma zona especifica ser estabelecida. 

Esses sao apenas alguns exemplos. Como uma tecnica exploratoria, suas aplicagbes 
sao virtualmente infinitas, facilitando a formulagao de novas hipoteses, a avaliagao de pre- 


11 


missas, a selegao de futuras ferramentas anah'ticas e o planejamento de futuras coletas de 
dados. 

1.3 Definigao de Comunidade e Circuitos Pecuarios 

A tarefa de dividir uma rede em comunidades, intuitiva a princfpio, nao e re- 
almente bem definida. Os principals elcmentos do problema, i.e. os conceitos de comu¬ 
nidade e cluster, nao sao rigorosamente definidos, requerendo urn grau de arbitrariedade 
e/ou bom senso. Uma grande variedade de algoritmos e ferramentas foram desenvolvidos 
para revelar a estrutura comunitaria de uma rede (Fortunato, 2010), e a escolha de qual 
algoritmo utilizar deve levar em consideragao as definigdes e premissas do modelo, e se os 
mesmos sao adequados para resolver o problema em questao. 

Como notado por Bigras-Poulin et al. (2006), em redes de movimentagao de 
gados de corte as fazendas agem no geral como produtoras (algumas com grau de en- 
trada igual a zero, chamadas de “fazendas de cria”) de gado, e abatedouros agem como 
escoadouros. Esses dois tipos de comportamento impoem urn fluxo direcionado a rede. 
E portanto razoavel assumir que a diregao dos movimentos nao pode ser ignorada sem a 
perda de informagao importante, e e mclhor usar ferramentas que levem em consideragao 
essa diregao sernpre que possfvel. 

As poucas aplicagdes recentes de detecgao de comunidades em redes de transito 
animal que consideram a diregao dos movimentos (Green, Gregory e Munro, 2009; Green 
et al., 2011) usarn a definigao de comunidade dada por Newman e Girvan (2004) e adap- 
tada a redes direcionadas por Leicht e Newman (2008): urn conjunto de nos e uma 
comunidade se o niimero de ligagbes internas a este exceder o esperado para urn mesmo 
conjunto de nos no modelo nulo (Fortunato, 2010). O que equivale a dizer que os nos que 
formam uma comunidade sao mais densamente conectados entre si do que um conjunto 
similar que nao forma uma comunidade. Essa definigao e bastante util e intuitiva, mas 
nao e a unica definigao de comunidade possfvel. 

Kim, Son e Jeong (2010) desenvolveram um metodo para detecgao de comu¬ 
nidades que leva em consideragao a direcionalidade e o peso das ligagoes, e que possui 


12 


melhor desempenho que o metodo desenvolvido por Leicht e Newman (2008) em alguns 
casos, trazendo uma definigao de comunidade mais adequada em algumas situagdes. Esse 
metodo e baseado no calculo do LinkRank, um conceito derivado do PageRank do Google 
(Page et al., 1999). Nessa definigao, uma comunidade e definida como um grupo de nos 
nos quais um passeador aleatorio permanece mais provavelmente do que o esperado pelo 
acaso. Se definirmos um circuito pecuario como o conjunto de localidades pelas quais um 
animal passara durante o ciclo produtivo (figura 1.3), entao essa definigao de comunidade 
e mais adequada para encontrar tais grupos, especialmente se desejamos compreender os 
fluxos entre zonas de produgao de uma regiao ou pais. Uma comunidade seria entao defi¬ 
nida como um grupo de locais onde um animal permanecera mais provavelmente durante 
sua vida (o ciclo produtivo) do que o esperado pelo acaso. 

Assim, o objetivo deste estudo foi implementar e testar um metodo de detecgao 
de comunidades que identifique circuitos pecuarios em uma rede de movimentagao de 
animais. 

Figura 1.3 - Exemplo de circuito pecuario 
















13 


2 MATERIAIS E METODOS 

2.1 Base de dados 

Foi analisada a rede interna de movimentagao de bovinos do Estado do Mato 
Grosso do ano de 2007 (movimentos realizados entre 01/01/2007 e 31/12/2007), fornecida 
pelo INDEA (Instituto de Defesa Agropecuaria do Estado do Mato Grosso). Essa base de 
dados contem informagoes sobre 87.899 propriedades (fazendas, frigorificos, eventos, etc) 
e 521.431 movimentos ao longo do ano, totalizando 15.844.779 de animais movimentados. 
Essa base foi analisada previamente por Negreiros (2010), que fez uma extensa busca 
para eliminar inconsistencias cadastrais. O Estado do Mato Grosso e o terceiro maior do 
Brasil, com uma area de 903.357 km 2 e o maior rebanho nacional, com aproximadamente 
28.757.438 bovinos (13% do rebanho nacional em 2010), sendo em sua maioria rebanhos de 
exploragao de corte (Instituto Brasileiro de Geografia e Estatistica, 2010). Esta localizado 
na regiao centro oeste do pais e possui 141 municfpios. 

Foram extraidas informagoes sobre as propriedades de origern e destino e sobre o 
numero de animais movimentados. Essas informagoes foram entao resumidas para a menor 
divisao publica administrativa, agrupando os movimentos feitos por propriedades que 
pertenciam ao mesmo municipio. A rede analisada possui portanto 141 nos (municipios) 
e 3.980 arestas, estas ultimas ponderadas pelo total de animais movimentados entre dois 
municipios durante o ano de 2007. A figura 2.1 traz uma representagao dessa rede, onde 
cada no esta localizado no centroide no respectivo municipio (aproximadamente). 

2.2 Detecgao de circuitos pecuarios 

Uma partigao C e uma divisao de um conjunto de N objetos em clusters (ou 
grupos) nao vazios e nao sobrepostos. Os termos clusters, grupos e comunidades serao 
utilizados como sinonimos no presente trabalho. E possivel representar uma partigao 
C como um vetor de tamanho N, no qua! o i-esimo elemento de C e igual o grupo ao 
qua! pertence o objeto i. Assirn, uma partigao C = {{1}, {1}, {2}, {2}} e a divisao de 
um conjunto de 4 objetos em dois grupos, nos quais os dois primciros objetos foram 
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Figura 2.1 - Rede de movimentagao interna de animais do Mato Grosso durante o ano de 
2007. Movimentos agrupados por munici'pios 



designados ao primeiro grupo e os dois ultimos objetos forarn designados ao segundo 
grupo. Da definigao de comunidades emerge uma fungao chamada modularidade, a qua! 
reflete a qualidade de qualquer partigao ern descrever a estrutura modular presente ern 
uma rede. Quanto maior o valor de modularidade de uma partigao, rnclhor essa partigao 
descreve a estrutura da rede. A fungao de modularidade proposta por Kim, Son e Jeong 
(2010) pode ser calculada usando a seguinte equagao: 



( 2 . 1 ) 


onde Q lr e a modularidade de uma dada partigao; L tJ e o valor de LinkRank da aresta 


que conecta os nos i e j; 7T* e o valor de PageRank do no z; 7ij e o valor de PageRank do 
no j; e 5 gi9j = 1 caso os nos i e j sejarn designados a mesrna comunidade e 5 gi9j = 0 caso 
contrario. O valor do LinkRank de uma dada aresta entre os nos i e j e uma medida de 
sua importancia, dada por: 



( 2 . 2 ) 
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onde 7Tj e o valor de PageRank (Page et al., 1999) do no i e G e a Matriz Google (“Google 
Matrix”, no original), uma matriz de probabilidade para o processo de passeio aleatorio. 
A equagao 2.1 pode entao ser formnlada da segninte maneira: 

Q — ^ Kj * [Gjj — ^j]Sg igi . (2-3) 

ij 

O PageRank e urn algoritmo de analise de ligagoes que produz urn ranking glo¬ 
bal da importancia de todos os nos de uma rede, baseado na matriz de probabilidade do 
processo de passeio aleatorio (tambern chamado de “caminhada do bebado”). Tradici- 
onalmente, o calculo do PageRank leva em consideragao o grau de entrada de urn no e 
o grau de entrada de seus vizinhos. Alternativamente, o PageRank pode ser calculado 
levando em consideragao o grau ponderado de entrada de urn no e o grau ponderado de 
entrada de seus vizinhos, o que foi feito neste trabalho, dada a importancia do numero 
absoluto de animais movimentados para a definigao de circuito pecuario. O PageRank 
e uma medida propagada atraves da rede, baseada na premissa de que nos importantes 
recebem ligagoes de nos importantes (figura 2.2). Para maiores detalhes, veja Langville e 
Meyer (2006) e Kim, Son e Jeong (2010). 

Figura 2.2 - PageRank calculado em rede simples 

PageRank 



Figura 2.2 - Legenda: 

Os nos A, B e C recebem o mesmo numero de ligagoes (i.e. grau de entrada igual a 1). No 
entanto, o no C possui um maior valor de PageRank que A e B, porque a ligagao que C 
recebe provem de um no importante (com maior grau de entrada, no D), elevando assim 
seu PageRank. 
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2.2.1 Numero de Bell, maximos locals e maximos globais 

Como pode ser visto na equagao 2.1, a modularidade depende da alocagao de 
N nos em 0 < g < N comunidades nao-vazias. Para encontrar a partigao de maior 
modularidade, seria preciso calcular a modularidade de todas as partigoes possiveis. O 
numero de partigdes possiveis para um conjunto de N objetos e dado pelo numero de Bell: 



(2.4) 


Utilizando a equagao 2.4, conclui-se que o numero de partigoes possiveis para um 
conjunto de 141 objetos, e de: 28.911.910.353.139.891.247.190.947.943.924.637.289.025.- 
637.429.885.820.537.824.520.005.904648.590.799.334.719.349.750.642.778141.473.707.684.- 
781.558.911.314.718.429.702.080.529.710.551.046.049.912.485.833.910.034.612.983.281.492.- 
385.095, ou aproximadamente 2.89 * 10 178 . Considerando que o calculo da modularidade 
de cada partigao lcve em media 5 milissegundos, o que parece ser uma boa estimativa, 
demoraria cerca de 1.6 * 10 168 anos para calcular a modularidade de todas as partigoes 
possiveis. Se fossem utilizados 1.000 computadores apenas para essa tarefa, o tempo seria 
reduzido para 1.6 * 10 165 anos. Se o calculo fosse otimizado para ser realizado a cada ciclo 
do processador de um computador, utilizando um processador moderno capaz de realizar 
5 milhoes de calculos por segundo (5GHz), ainda assim seriam necessarios 6.4 *10 160 anos, 
utilizando 1.000 computadores apenas para essa tarefa. Se faz necessario, portanto, um 
metodo para descobrir partigoes com altos valores de modularidade sem ter de calcular a 
modularidade de todas as partigdes existentes. 


Um metodo possivel seria comegar com uma partigao qualquer, digamos C 


{{1}, {2},..., {N}} e calcular a modularidade dessa partigao. Entao em cada passo po- 
deriamos sortear um no e verificar se a mudanga desse no para uma comunidade aleatoria 
forma uma partigao de maior modularidade. Caso a nova partigao possua uma modulari¬ 
dade maior, passamos a utilizar essa nova partigao. Propomos entao uma nova mudanga e 
continuamos ate que nao seja possivel, com qualquer mudanga, aumentar a modularidade. 


17 


A desvantagem desse metodo e que existe a possibilidade de obtermos uma 
particao de baixa modularidade, mas que a partir dela nenhuma mudanga liiiica resulte em 
aumento de modularidade. Essa situagao e conhecida como “maximo local” (figura 2.3). 
O maximo de uma fungao e chamado de “maximo global”. E necessario, portanto, urn 
metodo capaz de encontrar o maximo global de uma fungao sem que seja necessario 
calcular a modularidade de todas as partigbes possiveis do conjunto de dados. 

Figura 2.3 - Exemplo de fungao com dois maximos locais e urn global 



Figura 2.3 - Legenda: 

Os pontos 1 e 3 indicam maximos locais. O ponto 2 indica o maximo global da fungao. 

2.2.2 Otimizagao da fungao de modularidade 

Para otimizar a fungao de modularidade e encontrar uma partigao otima da 
rede, foi utilizado o algoritmo de Arrefecimento Simulado (Simulated Annealing - SA) 
(Kirkpatrick, Gelatt e Vecchi, 1983). Esse algoritmo e urn metodo de otimizagao baseado 
em um procedimento probabilistico que evita que a solugao encontrada pertenga a urn 
maximo local, e ja foi aplicado para a otimizagao de modularidade anteriormente (Guimera 
e Amaral, 2005; Kim, Son e Jeong, 2010; Good, de Montjoye e Clauset, 2010). 

No estado inicial, cada no e designado a sua propria comunidade. Em cada passo 
do algoritmo, um no aleatorio e designado a uma comunidade aleatoria, e a mudanga A Q lr 
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na modularidade e computada: 


A Q ,T = Q‘z - Q{ r, (2.5) 

onde Q l £ e a modularidade da nova partigao e Qq e a modularidade da partigao anterior. 
Se A Q lr > 0, a mudanga e aceita e a nova partigao e assimilada para o proximo passo. 
Se A Q lr < 0 entao ha uma probabilidade P(AQ lr ) de que a mudanga sera aceita: 

A (l lr 

P(AQ lr ) = exp(-f-), (2.6) 

onde T e um nurnero real positivo, representando a temperatura atual do sistema. Tal- 
vez valha a pena mencionar que T nao se trata de uma temperatura real. O rnetodo 
de arrefecimento simulado foi inspirado na termomecanica, e a repetigao desse processo 
durante tempo suficiente Simula o movimento de atornos de um material sob processo de 
recozimento a uma temperatura T, utilizado para obtengao de estados de baixa energia 
de um solido, daf o termo. 

Depois de / iteragdes o sistema e “resfriado”, multiplicando a temperatura pre¬ 
sente T por um fator de resfriamento c (0 < c < 1). Este processo se repete ate que 
o sistema esteja “congelado”, ou seja, nenhuma mudanga proposta e aceita durante o 
ciclo de uma temperatura. Isso significa que em altas temperaturas o sistema ira explorar 
muitas configuragoes, e a medida em que o algoritmo avanga e a temperatura decresce, o 
sistema passa a se concentrar nas melhores solugoes, evitando mudangas que decresgam 
muito o valor de modularidade. Um esquema simplificado se encontra na figura 2.4 

O nurnero lirnite de iteragoes /, o valor da temperatura inicial Tj e o fator de 
resfriamento c devem ser ajustados para cada fungao especffica a ser otimizada. Neste 
trabalho foram inicialmente utilizados os valores sugeridos por Guimera e Amaral (2005), 
posteriormente ajustados ate a obtengao de um desempenho satisfatorio, de maneira que 
o algoritmo teste um conjunto suficientemente grande de solugoes. Os valores foram 
ajustados em I = N 2 (N = nurnero de nos da rede), Tj = 1.000 e c = 0,95. Para 
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Figura 2.4 - Esquema de funcionamento do algoritmo de Arrefecimcnto Simulado 
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reduzir o tempo gasto pelo algoritmo, foi gerada uma matriz de Modularidade Mm, de 
tamanho N x N onde e o resultado de L t j — n^j, o termo dentro dos colchetes da 

equagao 2.1. Assim, essa matriz Mm contem a contribuicao a modularidade total caso os 
nos i e j sejam designados a mesrna comunidade, possibilitando o calculo direto de A Q lr , 
evitando o calculo da modularidade total da partigao testada a cada passo. 

2.2.3 Obtengao de uma solugao unica 

Good, de Montjoye e Clauset (2010) mostraram que redes com estrutura mo¬ 
dular apresentam frequentemente urn alto numero de degeneragoes, partigdes de alta mo¬ 
dularidade que escondem a partigao situada no maximo global (rnelhor solugao). Assim, 
frequentemente redes exibirao nao apenas um claro maximo global de modularidade, mas 
urn plato de solugoes, todas com alta modularidade, nao rnuito diferentes entre si. Ernbora 
isso parega irnpor um obstaculo para a detecgao de comunidades dentro de uma rede, na 
verdade mostra a possibilidade de escolhcr uma divisao da rede que atenda necessidades 
especificas de uma situagao sem violar a definigao de comunidade previamente definida. 
Ao inves de analisar todas as partigdes de alta modularidade, pode ser util extrair padroes 
comuns dessas partigdes, revelando onde elas concordam, i.e. quais nos aparecem juntos 
em todas as solugoes encontradas. A solugao final pode ser encarada como “blocos de cons- 
trugao”(“building blocks”), os quais podem ser submetidos posteriormente a um rnetodo 
de aglomeragao adequado. 

Para resumir a informagao obtida, foram selecionados os mclhores resultados 
(partigdes com valores de modularidade ate 1% abaixo do maximo encontrado) e identi- 
ficados como comunidades os grupos de municfpios que foram designados para o mesmo 
cluster em todas as partigdes selecionadas. Essa solugao foi obtida pela multiplicagao 
elcmento a elemento (produto Hadamard) das matrizes de similaridade de cada partigao 
selecionada: 

Sm = Smi o Sm 2 o ... o Sm n , (2.7) 

onde Sm e a matriz de similaridade correspondente a partigao final C e Sm n e a matriz 
de similaridade correspondente a partigao C n . Uma matriz de similaridade e uma matriz 
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esparsa de tamanho N x N, onde o elemento Srriij = 1 se os nos i e j pertencem ao 
mesmo cluster e 0 caso contrario. Tendo como estrutura comunitaria a partigao C, foi 
possfvel analisar o comercio de animais intra e intercomunitario. 

2.3 Avaliagao do desempenho do algoritmo 

Uma maneira util de avaliar se as partigdes obtidas sao similares ou diferentes 
entre si e a distancia de Variagao de Informagao (Variation of Information - VI) (Meila, 
2007). A distancia VI e uma metrica baseada em teoria da informagao e entropia, e mede 
a quantidade de informagao nao compartilhada entre duas partigdes. A entropia associada 
a uma partigao C e dada pela seguinte equagao: 


9 


H(C) = ~Y,P(9) log P(g), 


( 2 . 8 ) 


onde P(g) e a probabilidade de escolher um objeto aleatorio da partigao C que pertenga 
a comunidade g: 



(2.9) 


onde n g e o nurnero de objetos pertencentes a comunidade g. Logo H(C) prove a incerteza 
total a respeito de C. Define-se P(g,g') como a probabilidade de um objeto pertencer a 
comunidade g na. partigao C e simultaneamente a comunidade g' na partigao C", ou seja, 
a distribuigao conjunta das variaveis aleatorias associadas as duas partigdes: 



( 2 . 10 ) 


Entao a informagao mutua entre as partigoes C e C' e dada por: 



( 2 . 11 ) 
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e essa e a quantidade de incerteza sobre C' que e reduzida se conhecermos C. A Variagao 
de Informagao (figura 2.5) pode entao ser definida da seguinte maneira: 

VI(C, C') = H(C) + H(C') - 2 1(C, C'). (2.12) 


Figura 2.5 - Representagao grafica da Variagao de Informagao (Meila, 2007) 



Quando aplicada a duas partigdes iguais VI = 0. Quando aplicada a partigdes 
extremas que nao compartilham nenhuma informagao, como por exemplo a partigao onde 
cada no pertence a sua propria comunidade C = {{1}, {2},..., {N}} e a partigao onde 
todos os nos pertencem a mesma comunidade C = {g}, o valor de VI e o maximo possfvel, 
VI = log N (onde N e o tamanho das partigdes analisadas). Essa distancia foi calculada 
entre a solugao final, todas as solugoes dadas pelo algoritmo SA e 50 partigdes aleatorias. 
Esse conjunto de distancias pode ser organizado em uma matriz de distancia simetrica D , 
onde Dij = D Jtl que representa a VI entre as partigdes C % e Cj. 

2.3.1 Escalonamento multidimensional 

Para facilitar a interpretagao da magnitude das distancias encontradas, optou-se 
por projetar a matriz D em urn piano euclidiano utilizando a tecnica de escalonamento 
multidimensional. O escalonamento multidimensional (Multidimensional Scaling - MDS) 
constroi uma configuragao de N pontos em urn espago euclidiano tal que as distancias 



23 


entre pontos coincida, tanto quanto possfvel, as dissimilaridades originais entre N objetos 
(Cox e Cox, 2000). 

2.4 Softwares utilizados 

A funcao de modularidade, o algoritmo SA e o codigo para obtengao de uma 
solugao unica foram implementados no software R (R Development Core Team, 2010). Os 
mapas foram produzidos no software R (R Development Core Team, 2010), utilizando os 
seguintes pacotes: “PBSmapping” (Schnute et al., 2010), “maptools” (Lewin-Koh et al., 
2011), “sp” (Bivand, Pebesma e Gomez-Rubio, 2008) e “foreign” (R Development Core 
Team, 2011). As representagoes graficas de redes foram produzidas no software Geplii 
(Bastian, Heymann e Jacomy, 2009). As distancias VI foram calculadas utilizando o 
pacote “mcclust” (Fritsch, 2009). 
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3 RESULTADOS 

Apos 50 iteragoes, o algoritmo SA foi capaz de identificar 24 partigoes linicas 
que maximizam a fungao de modularidade. Essas partigoes sao muito similares entre si, 
tanto em termos de informagao como em valores de modularidade (figura 3.1 e figura 3.2). 


Figura 3.1 - Partigoes amostradas e superficie de modularidade. 



0.25 

0.2 

0.15 

0.1 

0.05 

0 

- 0.05 


Figura 3.1 - Legenda: 

Distancia entre os pontos nos eixos x e y representam a distancia VI (stress = 23.89). Pon- 
tos verdes sao partigoes obtidas pelo algoritmo SA, pontos pretos sao partigoes aleatorias 
e o pronto azul claro e a partigao final. A superficie colorida e a fungao de modularidade, 
reconstruida a partir de todas as partigoes analisadas. Partigoes obtidas pelo algoritmo 
SA estao localizadas no maximo da fungao de modularidade, muito proximas umas das 
outras quando comparadas com as partigoes aleatorias. Ainda, a partigao final permanece 
perto das solugoes do SA, e sua flexibilidade e obtida com o sacrificio de uma pequena 
parcela de sua modularidade. 


A solugao final, que resume a informagao de todas as outras partigoes, retem 
um bom valor de modularidade, apresentando uma alta flexibilidade para a definigao de 
clusters sem violar a definigao de comunidade escolhida. Esta possui 11 conmnidades, 
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Figura 3.2 - Partigoes obtidas com Arrefecimento Simulado e superffcie de modularidade 



sendo que 2 municfpios permaneceram desagrupados, dado que eles foram designados 
a comunidades distintas por duas ou mais partigbes (figuras 3.3 e 3.4). Apenas tres 
municfpios foram designados a comunidades nao adjacentes, mostrando que a solugao em 
questao possui um claro padrao geografico. 

A partigao encontrada mostra tambem um claro padrao comercial. Comuni¬ 
dades detectadas preferem comercializar animais internamente (Tabelas 3.1 e 3.2). Em 
10 das 11 comunidades encontradas um animal vendido tern mais chance de permanecer 
em sua propria comunidade (comprado por um no inferno a comunidade) do que ir para 
outra comunidade (Tabela 3.1). Embora a comunidade 3 mostre uma fraca preferencia 
em comercializar animais internamente, devido em grande parte ao sen intenso comercio 
com a comunidade 5 e 6 (Tabelas 3.1 e 3.2), o comercio interno e ainda maior do que o 
comercio desta com qualquer outra comunidade. 
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Figura 3.3 - Circuitos pecuarios do Mato Grosso (detalhado) 



(a) Movimentos internos (b) PageRank 

Figura 3.3 - Legenda: 

A posigao dos nos e dada pelo centroide do municfpio correspondente (aproximado). As 
cores dos nos identificam as 11 comunidades encontradas. Nos brancos permaneceram 
desagrupados. O tamanho da aresta e proporcional ao numero de animais movimentados 
entre dois municipios, e sua cor identifica a comunidade de origem de uma ligagao. Na 
figura 3.3(a) o tamanho dos nos e proporcional ao numero de animais comercializados 
internamente. Na figura 3.3(b) o tamanho dos nos e proporcional ao valor de PageRank. 
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Figura 3.4 - Circuitos pecuarios do Mato Grosso. 



(a) Municipios 



(b) Fluxo de animais 


Figura 3.4 - Legenda: 

A figura 3.4(a) rnostra as 11 commiidades encontradas (municipios em branco permane- 
cerarn desagrupados). A figura 3.4(b) rnostra o comercio entre commiidades: numeros 
representam a identificagao de cada commiidade (correspondendo as Tabelas 3.1 e 3.2); a 
intensidade da cor e o tamanho das arestas estao correlacionados com o numero de ani¬ 
mais comercializados entre duas commiidades; o tamanho dos nos depende do numero de 
animais transitados dentro de uma comunidade; e a intensidade de cor dos nos depende da 
probabilidade de que um animal vendido permanega em sua propria comunidade (diagonal 
da Tabela 3.1). 






Tabela 3.1 - Movimentos de safda (%). onde W V} e o nurnero de animais movimentados da comunidade i para a comunidade 

j, e kw° ut e o numero de animais vendidos pela comunidade i (grau ponderado de saida). Comunidades mostram clara preferencia de 
vender animais internamente. O comercio realizado pclos 2 municipios nao agrupados foi omitido. 



1 

2 

3 

4 

5 

6 

7 

8 

9 

10 

11 

Total de Animais 

1 

91,60 

0,02 

0,00 

0,00 

3,68 

0,69 

0,27 

1,44 

0,02 

1,56 

0,00 

2.519.752 

2 

0,02 

71,31 

0,13 

0,54 

1,35 

0,80 

19,21 

0,17 

6,26 

0,00 

0,08 

924.083 

3 

0,00 

10,54 

39,23 

0,00 

23,73 

10,69 

14,72 

0,04 

1,05 

0,00 

0,00 

89.107 

4 

0,00 

6,53 

0,00 

76,02 

0,01 

2,17 

7,04 

0,02 

2,41 

0,00 

5,80 

1.228.075 

5 

5,56 

0,30 

0,73 

0,00 

70,91 

0,27 

8,78 

10,57 

0,42 

0,00 

0,01 

523.644 

6 

0,08 

1,11 

1,07 

0,19 

0,00 

94,70 

1,74 

0,18 

0,14 

0,00 

0,74 

3.371.829 

7 

0,28 

9,44 

0,14 

0,17 

3,23 

1,11 

72,46 

9,73 

2,77 

0,00 

0,37 

1.265.583 

8 

2,14 

0,42 

0,00 

0,02 

3,39 

0,20 

8,17 

83,66 

0,78 

0,01 

0,01 

1.016.299 

9 

0,02 

5,31 

0,01 

0,22 

0,02 

0,07 

4,50 

0,16 

89,60 

0,01 

0,07 

3.439.689 

10 

15,18 

0,00 

0,02 

0,00 

0,22 

0,33 

0,00 

0,03 

0,01 

82,57 

0,01 

724.604 

11 

0,00 

4,10 

0,05 

3,26 

0,00 

16,66 

5,52 

0,01 

0,57 

0,00 

69,83 

656.241 


to 

oo 



Tabela 3.2 - Movimentos de entrada (%). M l3 = onde W l3 e o rnimero de animals movimentados da comunidade i para a comunidade 

j, e kw™ e o niimero de animais comprados pela comunidade j (grau ponderado de entrada). O comercio realizado pclos 2 munici'pios 
nao agrupados foi omitido. 



1 

2 

3 

4 

5 

6 

7 

8 

9 

10 

11 

1 

92,38 

0,05 

0,01 

0,00 

15,88 

0,52 

0,43 

3,32 

0,01 

6,08 

0,01 

2 

0,01 

58,75 

1,51 

0,51 

2,13 

0,22 

11,19 

0,14 

1,79 

0,00 

0,12 

3 

0,00 

0,84 

44,54 

0,00 

3,62 

0,28 

0,83 

0,00 

0,03 

0,00 

0,00 

4 

0,00 

7,15 

0,03 

95,60 

0,02 

0,78 

5,45 

0,02 

0,92 

0,00 

12,67 

5 

1,16 

0,14 

4,89 

0,00 

63,59 

0,04 

2,90 

5,05 

0,07 

0,00 

0,01 

6 

0,10 

3,34 

45,79 

0,67 

0,03 

94,19 

3,71 

0,54 

0,14 

0,00 

4,41 

7 

0,14 

10,65 

2,18 

0,22 

6,99 

0,42 

57,81 

11,23 

1,09 

0,00 

0,82 

8 

0,87 

0,38 

0,04 

0,02 

5,90 

0,06 

5,23 

77,57 

0,25 

0,01 

0,02 

9 

0,03 

16,30 

0,42 

0,78 

0,14 

0,08 

9,76 

0,49 

95,58 

0,03 

0,46 

10 

4,40 

0,00 

0,15 

0,00 

0,27 

0,07 

0,00 

0,02 

0,00 

92,58 

0,01 

11 

0,00 

2,40 

0,44 

2,19 

0,00 

3,23 

2,28 

0,01 

0,12 

0,00 

81,47 

Total de Animais 

2 . 498.589 

1 . 121.681 

78.501 

976.503 

583.919 

3 . 390.257 

1 . 586.209 

1 . 096.007 

3 . 224.366 

646.296 

562.458 


to 
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4 DISCUSSAO 

Ao enfrentar o desafio de definir de comunidades, a escolha de qua! algoritmo 
utilizar deve levar em consideragao as definigoes e premissas do modelo, e se os mesmos 
sao adequados para resolver o problema em questao. 

O rnetodo desenvolvido por Kim, Son e Jeong (2010) e baseado no calcnlo de 
LinkRank, uma medida baseada no PageRank e na rnatriz Google. O PageRank pode ser 
interpretado como a probabilidade de que um passeador aleatorio encontre um determi- 
nado no (utilizando uma taxa minim a fixa a, chamada de probabilidade de teletransporte, 
para maiores detalhes consultar Langville e Meyer (2006)). Ja a rnatriz Google traz as 
probabilidades de caminhos de safda de um no para um passeador aleatorio que esteja 
percorrendo a rede. Portanto, quando aplicado a uma rede ponderada e direcionada de 
transito animal entre municfpios, o rnetodo calcula os caminhos possfveis a serein per- 
corridos por um animal aleatorio, a quantidade de animais comercializados, a preferencia 
comercial das propriedades de cada municfpio, e a probabilidade de um animal aleatorio 
transitar por um determinado municfpio. Por ser uma medida propagada atraves da rede, 
nos que se encontram no fim do ciclo produtivo, como municfpios contendo frigorfficos e 
fazendas de engorda, acumulam uma rnaior fragao de PageRank. 

Uma alteragao no calculo do Pagerank poderia ajustar de maneira mais precisa a 
distribuigao de probabilidades referida, bastando para isso alterar a taxa a para um valor 
que reflit a a reposigao de animais no sistema como um todo. Ou, alternativamente, poder- 
se-ia alterar esse parametro para refletir a reposigao de animais apenas em propriedades 
de cria e ciclo complete, por exemplo. Tais alteragoes nao forarn realizadas, visto nao ser 
objetivo deste projeto avaliar esta probabilidade com tamanha precisao. 

O rnetodo, portanto, deveria. valorizar partigbes nas quais os animais possuam 
maior probabilidade de permanecer em uma comunidade do que sair desta. A unica 
ressalva e que, como pode ser observado na equagao 2.1, maior sera a contribuigao ao 
valor da modularidade da designagao de dois nos a mesma comunidade quanto maior for 
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a diferenga entre o LinkRank (L t j) e o produto de seus PageRanks ( y 'K i Tij). Trabalha- 
se com a premissa, portanto, de que e esperado que nos de elevado PageRank estejam 
conectados uns aos outros. Essa caracterfstica traz importantes implicagoes. Em primeiro 
lugar, se dois nos i e j de elevado PageRank nao possufrem urn alto valor nas celulas 
correspondentes da matriz de passeio aleatorio G VJ e G Jt (o que indica uma fraca conexao 
entre eles) esses nos provavelmente serao designados a comunidades diferentes, pois sua 
contribuigao a Q lr sera negativa (ja que, de acordo com a equagao 2.3, se Gij < i tj entao 
Q lr < 0). Com isso, nos que tendern a acumular grande parte do PageRank da rede, como 
municfpios que possuam frigorlficos ou grandes comerciantes de gado, serao designados a 
comunidades diferentes a nao ser que possuam elevado comercio entre si. Desta maneira, 
e rnais provavel que os municfpios com os maiores valores de PageRank da rede formem 
comunidades que orbitem ern volta deles, agregando municfpios de valores mais baixos de 
PageRank mas com os quais possuam elevados valores nas celulas da matriz Google. 

Em segundo lugar, urn par de municfpios com baixo valor de PageRank sera 
designado a mesma comunidade se possuir internamente uma fragao represent at iva do 
seu comercio Gij e Gji. Por ultimo, caso urn municfpio de baixo valor de PageRank i 
possua um comercio modesto com um municfpio de alto valor de PageRank j (represen- 
tado por um valor medio em G^, mas de modo que G tJ < iij) sua contribuigao a Q lr 
sera negativa. Obviamente, essas dedugbes atuarn de maneira conjunta para os 141 mu¬ 
nicfpios estudados, e o metodo de maximizagao utilizado busca a melhor combinagao de 
municfpios em grupos, de modo que se a contribuigao de dois nos a modularidade for 
negativa (Q l £ < 0), mas superada pela agregagao de arnbos a mesma comunidade de um 
terceiro {Ql r m » 0; Q l j m » 0), arnbos serao designados ao mesmo grupo. 

Dessa maneira, valoriza-se ligagoes fortes com nos de baixo PageRank, o que 
implica em descontar o efeito agregador que municfpios de alto PageRank exercem na rede. 
Ainda, o metodo praticamente ignora o comercio fcito de maneira ocasional (onde G t j e 
baixo), o que e desejavel para uma tecnica exploratoria desta natureza, haja vista que o 
objetivo principal e realgar os grandes padrbes de movimentagao e reduzir a sobrecarga 
decorrente do excesso de informagoes causado por movimentos nao-significativos. 
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Outro metodo possivel de ser utilizado, projetado para redes direcionadas, e o 
metodo de Leiclit e Newman (2008), o qua! utiliza a seguinte equagao para o calculo de 
modularidade: 

1 j Lin h,out 

ij 

Como pode ser visto na equagao 4.1, o metodo de Leicht e Newman (2008) considera o 
numero de ligagdes de cada no, e pode ser adaptado para uma rede ponderada, alterando 
a rnatriz de adjacencia A pela matriz contendo o peso das arestas W, e alterando os 
termos de grau kf 1 e k° ut pelos graus ponderados kw™ e kw° ut . No entanto, o metodo 
nao utiliza ern seus calculos a topologia da rede como urn todo, apenas dados dos nos 
individualmente, como grau de entrada e grau de saida. Embora o metodo de Kim, Son e 
Jeong (2010) tambern utilize caracteristicas individuais de nos e arestas, como PageRank 
e LinkRank, esses sao fruto de um calculo que leva ern consideragao a topologia da rede 
estudada, sendo portanto influenciados por ligagoes indiretas a estes, como por exemplo 
o fluxo encadeado de animais entre varios municipios. 

Embora a tecnica de arrefecimento simulado tenha encontrado varias partigoes 
distintas, esses resultados mostram uma notoria similaridade entre si, concordando na 
alocagao em comunidades da maioria dos municipios, o que e evidenciado pela figura 3.1, 
onde nota-se que as partigoes encontradas possuem baixa Variagao de Informagao entre si. 
E possivel notar, na figura 3.2, que as partigoes obtidas tambern possuem valores muito 
similares de modularidade (entre 0,22 e 0,23). 

Redes que possuem rnais de uma partigao com alto valor de modularidade sao 
comuns e esperadas. Isso apresenta um obstaculo para escolhcr, dentre varias partigoes, 
qual seria a correta. No entanto, e possivel perceber essa caracteristica como uma vanta- 
gem, dado que possibilita a escolha da partigao que melhor atenda as necessidades de um 
pesquisador ou tomador de decisao, mantendo a definigao escolhida de comunidades. 

Extrair as concordancias entre as diferentes partigoes e uma maneira util de 
obter grupos pequenos que podem ser posteriormente aglomerados de maneira a atender 
os objetivos especificos de um estudo sem violar a definigao de comunidade escolhida. 
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Nota-se na figura 3.1 a baixa Variagao de Informagao entre a partigao final, 
obtida atraves do produto Hadamard, e as partigdes encontradas pelo algoritmo de Ar- 
refecimento Simulado. Isto evidencia que grande parte da informagao contida nas 24 
partigoes encontradas foi conservada apos a operagao que deu origern a solugao final. 

A figura 3.4(a) mostra que a partigao obtida reflete urn claro padrao comercial, 
no qual apenas tres municfpios foram designados a uma comunidade com a qual nao 
possuem contato geografico. Seria necessario verificar individualmente a razao deste fato 
curioso. Um deles, o municfpio de Ipiranga do Norte, foi criado em 2005, desmembrado 
do municfpio de Tapurah, que por sua vez foi designado a uma comunidade adjacente, 
mantendo o padrao encontrado no restante do estado. Uma possfvel explicagao seria a de 
que, em 2007, o sistema do INDEA se encontrasse em fase de adequagao a existencia, do 
municfpio, atualizando dados cadastrais dos produtores da regiao. 

Na figura 3.3(b) nota-se que muitas comunidades possuem um on dois municfpios 
com alto valor de PageRank. Na comunidade de cor laranja, no sudoeste do estado, o 
municfpio de Tangara da Serra e o que se destaca com maior valor de PageRank. Na 
comunidade de cor azul clara, no centra sul do estado, os municfpios sao Cuiaba (a 
capital do estado) e Varzea Grande (situado na regiao metropolitana de Cuiaba). Na 
comunidade vermelha, na regiao leste do estado, o municfpio de destaque e Barra do 
Gargas. Na comunidade azul escura, no sudeste do estado, destacam-se os municfpios 
de Rondonopolis e Pedra Preta. Na comunidade de cor verde clara, no centro leste do 
estado, nota-se o municfpio de Paranatinga. Na comunidade verde escura, no centro norte 
do estado, destacam-se, de maneira mais modesta, os municfpios de Sinop e Colider. Todos 
os municfpios mencionados sao conhecidos por conterem um on mais frigorfficos em seus 
territorios, o que corrobora a hipotese de que nos no fim da cadeia produtiva concentram 
grande parte do PageRank da rede e de suas respectivas comunidades. 

Nota-se, atraves das tabclas 3.1 e 3.2, que essa solugao final e consistente com 
a ideia de circuitos pecuarios, visto que um animal vai mais provavelmcnte permanecer 
em sua comunidade de origern, ao inves de ser transferido para outra comunidade qual- 
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quer. A unica excegao a essa regra e a comunidade 3. Como pode ser visualizado na 
figura 3.4, esta comunidade e formada por apenas tres municipios da regiao central do 
estado, todos com baixo valor de PageRank (figura 3.3(b)), indicando, possivelmente, a 
ausencia de frigorificos na regiao. Na tabela 3.2 vemos que esta e a comunidade que menos 
comprou animais (cerca de 80.000), e que a mesma adquire animais prioritariamente da 
comunidade 6 (45,79% dos animais comprados), situada imediatamente ao norte desta. 
Na tabela 3.1 vemos que esta e a comunidade que menos vende animais (cerca de 90.000), 
prioritariamente para as comunidades 2 (10,54%), 5 (23,73%), 6 (10,69%) e 7 (14,72%). 
A excegao da comunidade 6, todas essas se situam ao sul da comunidade 3 (figura 3.4(b)), 
caracterizando a mesma como uma ponte entre municipios do norte (comunidade 6) e 
municipios do sul (comunidades 2, 5 e 7). 

Esse padrao de movimentagao, caracterizado pelo fluxo de animais no sentido 
norte-sul, pode ser observado em outras regibes do estado, com o auxilio da figura 3.4(b) 
e da tabela 3.1. Comegando pela regiao nordeste, por exemplo, vemos que a comunidade 
10 envia 15,18% de seus animais vendidos para a comunidade 1, que por sua vez envia 
3,68% de seus animais vendidos para a comunidade 5, que por sua vez envia animais para 
as comunidades 7 (8,78%) e 8 (10,57%). Ja na regiao noroeste, nota-se a existencia de 
dois fluxos distintos. Um no sentido oeste-leste, comegando pela comunidade 4, que envia 
animais para a comunidade 11 (5,8%), que por sua vez envia animais para a comunidade 6 
(16,66%). E outro no sentido norte-sul, comegando tambem pela comunidade 4, enviando 
animais para as comunidades 2 (6,53%) e 7 (7,04%). Paralelamente, a comunidade 11 
envia animais para as comunidades 2 (4,1%) e 7 (5,52%), e a comunidade 6 envia animais 
para as comunidades 2 (1,11%), 3 (1,07%) e 7 (1,74%). Esse fluxo pode ser causado pela 
concentragao da populagao humana na regiao sul do estado, ao redor da capital Cuiaba, 
ou pela proximidade desta regiao com o estado de Sao Paulo, onde localiza-se grande 
mercado consumidor de carnes. 

Fica evidenciado que apos uma analise da estrutura da industria pecuaria em 
um estado, e possivel fornecer informagbes importantes para aplicagbes diversas na area 
de defesa sanitaria, principalmente na vigilancia e no controle de enfermidades. Ao obter 
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unia partigao na qual animais possuam a tendencia de permanecer em suas regides, urn 
estudo de circulagao viral pode levar em conta as diferentes comunidades encontradas 
na sua estratificagao, buscando assim dividir a area estudada em diferentes zonas de 
produgao. Considerando a relagao entre os circnitos pecuarios, seria possivel, na ocasiao 
de erradicagao de uma doenga especifica, atuar sequencialmente nessas diferentes zonas de 
produgao, comegando por aquelas que possuam rnenor probabilidade de reinfecgao, ou que 
dependam rnenos, do ponto de vista economico, do ingresso de animais de outras regides, 
na eventual possibilidade de criar zonas com diferentes status sanitario com restrigao de 
comer cio. 

Uma possivel analise seria agregar as informagoes dos fluxos de animais com a 
infraestrutura do estado para locomogao de animais e suas particularidades ambientais, 
como grandes estradas e rotas de transito que sao bloqueadas na estagao de chuvas, a 
fim de estudar como o fluxo de animais e influenciado por estes. Nota-se, por exemplo, 
na figura 3.3 que na regiao nordeste do estado ha uma extensao no sentido norte-sul 
entre as comunidades 6, 5, 1 e 10 (figura 3.4(b)) com baixa densidade de ligagoes. Esta 
extensao corresponde a area do Parque Indigena do Xingu, criado em 1961, que possui 
aproximadamente 27.000 km 2 . 

A solugao final apresenta urn padrao geografico e comercial claro, caracteristica 
crucial para aplicagoes em medicina veterinaria preventiva, alem de possuir uma inter- 
pretagao clara e util em redes de comercio onde ligagoes emergem das escolhas de nos co- 
merciantes, e esses ultimos sao fortemente influenciados pelos “hubs” (nos com alto valor 
de PageRank), os quais normalmente apresentam alta competitividade quando compara- 
dos com outros nos da rede. A solugao final tambem e consistente do ponto de vista de 
informagao, dada a baixa Variagao de Informagao entre esta e as partigoes encontradas 
polo Arrefecimento Simulado. A tecnica apresentada permite extrair informagoes relevan- 
tes acerca do fluxo de uma rede de transito animal, permitindo urn melhor entendimento 
da relagao existente entre suas zonas de produgao. 
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5 CONCLUSOES 

Vimos que o metodo descrito nessa tese pode revelar a estrutura comunitaria de 
lima rede direcionada de transito animal. Acreditamos que essa abordagem e apropriada 
para redes de transito animal e circuitos pecuarios, assim como outras redes onde o carni- 
nho percorrido por uni passeador aleatorio (on as escolhas dos nos em estabclecer ligagbes 
com outros nos) esta inclm'da na definigao de comunidade. Essa abordagem pode ser 
utilizada para melhor compreender o fluxo interno de uma rede, ajudar no planejamento 
de um sistema de vigilancia baseado em risco, melhorar modelos preditivos, guiar uma 
amostra estratificada, determinar areas alvos para programas sanitarios e definir zonas 
para restrigao de movimentagao. 



37 


REFERENCI AS 

Bastian, M.; Heymann, S.| Jacomy, M. Gephi: An Open Source Software for 
Exploring and Manipulating Networks. In: International AAAI Conference on 
Weblogs and Social Media. 2009. 

Bates, D.; Maechler, M. Matrix: Sparse and Dense Matrix Classes and Methods. 

2011 . 

Bigras-Poulin, M.; Thompson, R.A.; Chriel, M.; Mortensen, S.; Greiner, 

M. Network analysis of Danish cattle industry trade patterns as an evaluation of risk 
potential for disease spread. Preventive veterinary medicine, vol. 76, no. 1-2: pp. 
11-39. 2006. 

Bivand, R.S.; Pebesma, E.J.; Gomez-Rubio, V. Applied spatial data analysis with 
R, 2008. 

Cox, T.; Cox, M. Multidimensional Scaling, Second Edition, vol. 88 of 
C&H/CRC Monographs on Statistics & Applied Probability. Chapman and 
Hall/CRC. 2000. 

FORTUNATO , S. Community detection in graphs. Physics Reports, vol. 486, no. 3-5: 
pp. 75-174. 2010. 

Fritsch, A. mcclust: Process an MCMC Sample of Clusterings. 2009. 

Gibbens, J.C.; Sharpe, C.E.; Wilesmith, J.W.; Mansley, L.M.; 
Michalopoulou, E.; Ryan, J.B.M.; Hudson, M. Descriptive epidemiology of the 
2001 foot-and-mouth disease epidemic in Great Britain: the Erst five months. 
Veterinary Record, vol. 149, no. 24: pp. 729-743. 2001. 

Good, B.H.; de Montjoye, Y.A.; Clauset, A. Performance of modularity 
maximization in practical contexts. Physical Review E. vol. 81, no. 4: p. 20. 2010. 

Green, D.M.; Gregory, A.; Munro, L.A. Small- and large-scale network structure 
of live fish movements in Scotland. Preventive veterinary medicine, vol. 91, no. 2-4: 
pp. 261-9. 2009. 

Green, D.M.; Werkman, M.; Munro, L.A.; Kao, R.R.; Kiss, I.Z.; Danon, L. 
Tools to study trends in community structure: application to fish and livestock trading 
networks. Preventive veterinary medicine, vol. 99, no. 2-4: pp. 225-8. 2011. 

GuiMERA, R.; Amaral, L.A.N. Cartography of complex networks: modules and 
universal roles. Journal of statistical mechanics (Online), vol. 2005, no. P02001: p. 
nihpa35573. 2005. 

Harvey, N.; Reeves, A.; Schoenbaum, M.a.; Zagmutt-Vergara, F.J.; Dube, 
C.; Hill, A.E.; Corso, B.a.; McNab, W.B.; Cartwright, C.I.; Salman, M.D. 
The North American Animal Disease Spread Model: a simulation model to assist 
decision making in evaluating animal disease incursions. Preventive veterinary 
medicine, vol. 82, no. 3-4: pp. 176-97. 2007. 



Instituto Brasileiro de Geografia e Estatistica, I. Pesquisa Pecuaria 
Municipal. 2010. 

Kim, Y.; Son, S.W.; Jeong, H. Finding communities in directed networks. Physical 
Review E. vol. 81, no. 1: pp. 1-9. 2010. 

Kirkpatrick, S.; Gelatt, C.D.J.; Vecchi, M.P. Optimization by Simulated 
Annealing. Science, vol. 220, no. 4598: pp. 671-680. 1983. 

Langville, A.N.; Meyer, C.D. Google’s PageRank and Beyond: The Science 
of Search Engine Rankings. Princeton University Press. 2006, 240 pp. 

Leicht, E.; Newman, M.E.J. Community Structure in Directed Networks. Physical 
Review Letters, vol. 100, no. 11: pp. 1-4. 2008. 

Lentz, H.H.K.; Konschake, M.; Teske, K.; Kasper, M.; Rother, B.; 
Carmanns, R.; Petersen, B.; Conraths, F.J.; Selhorst, T. Trade communities 
and their spatial patterns in the German pork production network. Preventive 
veterinary medicine, vol. 98, no. 2-3: pp. 176-81. 2011. 

Lewin-Koh, N.J.; Bivand, R.; Pebesma, E.J.; Archer, E.; Baddeley, A.; 
Bibiko, H.J.; Dray, S.; Forrest, D.; Friendly, M.; Giraudoux, P.; Golicher, 
D.; Rubio, V.G.; Hausmann, P.; Hufthammer, K.O.; Jagger, T.; Luque, S.P.; 
MacQueen, D.; Niccolai, A.; Short, T.; Stabler, B.; Turner, R. maptools: 
Tools for reading and handling spatial objects. 2011. 

Lusseau, D.; Newman, M.E.J. Identifying the role that animals play in their social 
networks. Proceedings Biological sciences / The Royal Society, vol. 271 Suppl: 
pp. S477-81. 2004. 

Lusseau, D.; Schneider, K.; Boisseau, O.J.; Haase, P.; Slooten, E.; Dawson, 
S.M. The bottlenose dolphin community of Doubtful Sound features a large proportion 
of long-lasting associations. Behavioral Ecology and Sociobiology, vol. 54, no. 4: 
pp. 396-405. 2003. 

Martinez-Lopez, B.; Perez, A.M.; Sanchez-Vizcai'no, J.M. Social network 
analysis. Review of general concepts and use in preventive veterinary medicine. 
Transboundary and emerging diseases, vol. 56, no. 4: pp. 109-20. 2009. 

Meila, M. Comparing clusterings—an information based distance. Journal of 
Multivariate Analysis, vol. 98, no. 5: pp. 873-895. 2007. 

Negreiros, R.L. Caracterizagao e analise da rede de movimentagao de 
bovinos no Estado de Mato Grosso. 2010. Tese (Doutorado ern Ciencias) - 
Faculdade de Medicina Veterinaria e Zootecnia, Universidade de Sao Paulo, Sao Paulo. 

2010, 121 pp. 

Newman, M.; Girvan, M. Finding and evaluating community structure in networks. 
Physical Review E. vol. 69, no. 2: pp. 1-15. 2004. 


Page, L.; Brin, S.; Motwani, R.; Winograd, T. The PageRank Citation Ranking: 
Bringing Order to the Web. Stanford InfoLab. 1999. 



39 


R Development Core Team. R: A language and environment for statistical 
computing. 2010. 

R Development Core Team, foreign: Read Data Stored by Minitab, S, SAS, SPSS, 
Stata, Systat, dBase, ... 2011. 

Salathe, M.; Jones, J.H. Dynamics and control of diseases in networks with 
community structure. PLoS computational biology, vol. 6, no. 4: p. el000736. 2010. 

Schnute, J.T.; BOERS, N.; Haigh, R.; Couture-Beil, A. PBSmapping: Mapping 
Fisheries Data and Spatial Analysis Tools. 2010. 

World Organisation for Animal Health. Terrestrial Animal Health Code, 
vol. 33. World Organisation for Animal Health. 2010, 1-19 pp. 



40 


APENDICE - Codigos desenvolvidos 
Algoritmo 

O codigo deve ser utilizado na seguinte ordem: 

1. Em uma rede com N nos, criar uma matriz W de tamanho NxN , onde W tJ e a 
quantidade de animals que o no i enviou ao no j\ 

2. Calcular a matriz de hiperlinks normalizada por linhas //: 

3. Calcular o vetor de PageRank pr; 

4. Calcular a matriz Google G] 

5. Calcular a matriz de LinkRank Lrn: 

6. Calcular a matriz de Modularidade Mm ; 

7. Executar o Arrefecimento Simulado. 

Todos os codigos foram implementados no programa R (R Development Core 
Team, 2010). Os codigos para calcular a matriz de hiperlinks normalizada por linhas 
(77), o vetor de PageRank (pr) e a matriz Google (G) foram adaptados dos codigos 
disponiveis por Langville e Meyer (2006). O codigo para produzir a rede de referenda 
(Kim, Son e Jeong, 2010) utilizam o pacote “Matrix” (Bates e Maechler, 2011). 

Codigos em linguagem R 

Codigo para produzir a matriz de hiperlinks normalizada por linhas (77): 

rnhm <- function(A) 

{ 

Srow <- rowSums(A) 
n <- dira(A) [1] 

H <- matrix(0,n,n) 
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for (i in l:n) 

{ 

if (Srow[i] != 0) 

H [i, ] <- A [i,]/Srow [i] 

} 

return(H) 


Codigo para calcular o vetor de PageRank ( pr ): 

pagerank <- function(H,alpha=0.85,epsilon=le-8,pr0) 

{ 

n <- dim(H)[1] 
if (missing(prO)) 
prO <- rep(l/n,n) 
rowsumvector <- rowSums(H) == 0 
a <- rowsumvector*1 
residual <- 1 
pr <- prO 

while (residual >= epsilon) 

{ 

prevpr <- pr 

pr <- as.vector((alpha*pr)%*%H) + (alpha*(pr%*%a)+l-alpha)*rep(l/n,n) 
residual <- dist(rbind(pr,prevpr),method=Manhattan ; ) 

> 

return(pr) 


Codigo para produzir a matriz Google (G): 


gmatrix <- function(A,alpha=0.85) 



Srow <- rowSums(A) 


n <- dim(A)[1] 

G <- matrix(0,n,n) 
for (i in l:n) 

{ 

if (Srow[i] != 0) 

G[i,] <- alpha*(A[i,]/Srow[i]) + (1/n)*(1-alpha) 
else 

G[i,] <- 1/n 

} 

return(G) 


Codigo para calcular a matriz de LinkRank (. Lm ): 

linkrank <- function (G,pr) 

{ 

n <- length(pr) 

L <- matrix(0,n,n) 
for (i in l:n) 

L [i, ] <- pr[i] * G [i,] 
return(L) 

} 


Codigo para produzir a matriz de Modularidade {Mm) 

IrmM <- function(L,pr) 

{ 

n <- length(pr) 
qlrM <- matrix(0,n,n) 
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prMA <- pr%o%pr 
for (i in l:n) 

{ 

LL <- L [i ,] 
prL <- prMA[i,] 
for (j in l:n) 

{ 

qlrM [i, j] <- LL[j] - prL[j] 

} 

} 

diag(qlrM) <- 0; 
return(qlrM) 


Codigo do Arrefecimento Simulado: 

kim <- function(qlrM, Tc=l, minTc=le-10, cool=0.995, 
raax_itry, raax_heat, max_rej) 

{ 

#Parameters 

n <- dim(qlrM)[1] 
c <- l:n 
lc <- unique(c) 
if (missing(max_itry)) 
max_itry <- n~2 
if (missing(max_heat)) 

max_heat <- 0.125 * max_itry 
if (missing(max_rej)) 
max_rej <- max_itry 


#Initial variables 
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itry <- heat <- rej <- 0 

while (Tc >= minTc & rej < max_rej) 

{ 

itry <- itry+1 
nsort <- sample(n,l) 

csort <- sample(lc[-which(lc==c[nsort])],1) 

LqlrM <- qlrM[nsort,] 

CqlrM <- qlrM[,nsort] 

oldm <- sum(LqlrM [c==c [nsort]]) + sum(CqlrM[c==c [nsort]]) 
newm <- sum(LqlrM[c==csort]) + sum(CqlrM[c==csort]) 
if (newm>=oldm) 

{c[nsort] <- csort} 
else 
{ 

if (runif(l) < exp((newm-oldm)/Tc)) 

{ 

c [nsort] <- csort 
heat <- heat + 1 
} 

else 

{ 

rej <- rej + 1 

} 

} 

if (itry > max_itry | heat > max_heat) 

{ 

Tc <- cool*Tc 
itry <- heat <- rej <- 0 
> 
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} 

#Last ouptut 

writeLines(paste(paste(’Final Temperature = ’, signif(Tc,digits=l)),’\n J )) 
return(c) 


Fungao para criar a rede de referenda proposta por Kim, Son e Jeong (2010). 
Depende do pacote Matrix (Bates e Maechler, 2011): 

benchmark <- function(size,n,w=l) 

{ 

require(Matrix) 

comm <- Matrix(0,nrow=size, ncol=size, sparse = T) 

#internal links 
for (i in 1:(size-1)) 
comm[i,i+l] <_ 1 

comm[i+l,l] < _ 1 

network <- comm 
for (i in 1:(n-1)) 

network <- bdiag(network,comm) 

#external links 

central.node <- ceiling(median(l:size)) 
for (i in 1:(n-1)) 

network[central.node+size*(i-1),l+size*i] <- w 
network[central.node+(size*(n-1)),1] <- w 
return(network) 


Exemplo utilizando a rede de referencia proposta por Kim, Son e Jeong (2010). 


size <- 4; n <- 4; w <- 1 


A <- benchmark(size,n,w) 
H <- rnhm(A) 
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pr <- pagerank(H) 

G <- gmatrix(A) 

L <- linkrank(G,pr) 
qlrM <- lrmM(L,pr) 

membership <- kim(qlrM,Tc=0.1,minTc=0.0005) 



